在约束凸优化中,基于椭球体或切割平面方法的现有方法与环境空间的尺寸不符比展出。诸如投影梯度下降的替代方法,仅为诸如欧几里德球等简单凸起集提供的计算益处,其中可以有效地执行欧几里德投影。对于其他集合,投影的成本可能太高。为了规避这些问题,研究了基于着名的Frank-Wolfe算法的替代方法。这些方法在每次迭代时使用线性优化Oracle而不是欧几里德投影;前者通常可以有效地执行。此类方法还扩展到在线和随机优化设置。然而,对于一般凸套,弗兰克 - 沃尔夫算法及其变体不会在后悔或速率方面实现最佳性能。更重要的是,在某些情况下,他们使用的线性优化Oracle仍然可以计算得昂贵。在本文中,我们远离Frank-Wolfe风格的算法,并提出了一种新的减少,将任何在欧几里德球(其中投影廉价)上定义的任何算法的算法转移到球上包含的受限组C上的算法,而不牺牲原始算法的性能多大。我们的缩减需要O(t log t)在t回合后对C的成员资格Oracle调用,并且不需要对C的线性优化。使用我们的减少,我们恢复最佳遗憾界限[resp。在在线[RESP的迭代次数方面。随机]凸优化。当环境空间的尺寸大时,我们的保证在离线凸优化设置中也是有用的。
translated by 谷歌翻译
收购数据是机器学习的许多应用中的一项艰巨任务,只有一个人希望并且预期人口风险在单调上汇率增加(更好的性能)。事实证明,甚至对于最小化经验风险的最大限度的算法,甚至不令人惊讶的情况。在训练中的风险和不稳定的非单调行为表现出并出现在双重血统描述中的流行深度学习范式中。这些问题突出了目前对学习算法和泛化的理解缺乏了解。因此,追求这种行为的表征是至关重要的,这是至关重要的。在本文中,我们在弱假设下获得了一致和风险的单调算法,从而解决了一个打开问题Viering等。 2019关于如何避免风险曲线的非单调行为。我们进一步表明,风险单调性不一定以更糟糕的风险率的价格出现。为实现这一目标,我们推出了持有某些非I.I.D的独立利益的新经验伯恩斯坦的浓度不等式。鞅差异序列等进程。
translated by 谷歌翻译
由于在许多领域的无与伦比的成功,例如计算机视觉,自然语言处理,推荐系统以及最近在模拟多物理问题和预测非线性动力学系统方面,深度学习引起了人们的关注。但是,建模和预测混乱系统的动态仍然是一个开放的研究问题,因为训练深度学习模型需要大数据,在许多情况下,这并不总是可用的。可以通过从模拟结果获得的其他信息以及执行混乱系统的物理定律来培训这样的深度学习者。本文考虑了极端事件及其动态,并提出了基于深层神经网络的优雅模型,称为基于知识的深度学习(KDL)。我们提出的KDL可以通过直接从动力学及其微分方程中对真实和模拟数据进行联合培训来学习控制混乱系统的复杂模式。这些知识被转移到模型和预测现实世界中的混乱事件,表现出极端行为。我们通过在三个实际基准数据集上进行评估来验证模型的效率:El Nino海面温度,San Juan登革热病毒感染和BJ {\ o} rn {\ o} ya每日降水,所有这些都受极端事件的控制'动态。利用对极端事件和基于物理的损失功能的先验知识来领导神经网络学习,我们即使在小型数据制度中也可以确保身体一致,可推广和准确的预测。
translated by 谷歌翻译
在本文中,我们提出了Primatul,这是一种用于从细粒识别中使用的数据集的零件检测器无监督学习的新型算法。它利用了训练集中所有图像的宏观相似性,以便在预先训练的卷积神经网络的特征空间中进行重复的模式。我们提出了实施检测部件的局部性和统一性的新目标功能。此外,我们根据相关评分将检测器嵌入置信度度量,从而允许系统估计每个部分的可见性。我们将我们的方法应用于两个公共细粒数据集(Caltech-UCSD Bird 200和Stanford Cars),并表明我们的探测器可以一致地突出物体的一部分,同时很好地衡量了对其预测的信心。我们还证明,这些探测器可直接用于构建基于零件的细粒分类器,这些分类器在基于原型的方法的透明度与非解剖方法的性能之间提供了良好的折衷。
translated by 谷歌翻译
我们提出了Caisar,这是一个正在积极开发的开源平台,以表征AI Systems的鲁棒性和安全性。Caisar提供了一个统一的入口点,用于使用WhyML(Why3验证平台的成熟和表达语言)来定义验证问题。此外,Caisar协调并创建了最先进的机器学习验证工具,该工具单独无法有效地处理所有问题,但总体可以涵盖越来越多的属性。我们的目的是一方面,通过减少选择针对给定验证问题量身定制的方法的负担来协助V \&v流程,另一方面描述一个平台。CAISAR很快将在https://git.frama-c.com/pub/caisar提供。
translated by 谷歌翻译
Generating realistic lip motion from audio to simulate speech production is critical for driving natural character animation. Previous research has shown that traditional metrics used to optimize and assess models for generating lip motion from speech are not a good indicator of subjective opinion of animation quality. Devising metrics that align with subjective opinion first requires understanding what impacts human perception of quality. In this work, we focus on the degree of articulation and run a series of experiments to study how articulation strength impacts human perception of lip motion accompanying speech. Specifically, we study how increasing under-articulated (dampened) and over-articulated (exaggerated) lip motion affects human perception of quality. We examine the impact of articulation strength on human perception when considering only lip motion, where viewers are presented with talking faces represented by landmarks, and in the context of embodied characters, where viewers are presented with photo-realistic videos. Our results show that viewers prefer over-articulated lip motion consistently more than under-articulated lip motion and that this preference generalizes across different speakers and embodiments.
translated by 谷歌翻译
Generalized linear models with nonlinear feature transformations are widely used for large-scale regression and classification problems with sparse inputs. Memorization of feature interactions through a wide set of cross-product feature transformations are effective and interpretable, while generalization requires more feature engineering effort. With less feature engineering, deep neural networks can generalize better to unseen feature combinations through low-dimensional dense embeddings learned for the sparse features. However, deep neural networks with embeddings can over-generalize and recommend less relevant items when the user-item interactions are sparse and high-rank. In this paper, we present Wide & Deep learning-jointly trained wide linear models and deep neural networks-to combine the benefits of memorization and generalization for recommender systems. We productionized and evaluated the system on Google Play, a commercial mobile app store with over one billion active users and over one million apps. Online experiment results show that Wide & Deep significantly increased app acquisitions compared with wide-only and deep-only models. We have also open-sourced our implementation in TensorFlow.
translated by 谷歌翻译